经验分布函数(常缩写为 EDF):用样本数据直接构造出来的分布函数,用来描述样本在数轴上“累积到某个值以下的比例”。常写作
(F_n(x)=\frac{1}{n}\sum_{i=1}^n \mathbf{1}(X_i\le x)),表示样本中不超过 (x) 的观测所占比例。它是总体分布函数的一种数据驱动估计。(该词组在统计学语境中最常见;在别的领域很少用。)
/ɪmˈpɪrɪkəl ˌdɪstrɪˈbjuːʃən ˈfʌŋkʃən/
The empirical distribution function shows the fraction of observations less than or equal to x.
经验分布函数显示样本中小于或等于 x 的观测所占比例。
Using the empirical distribution function, we can compare two samples without assuming any parametric model for the underlying distribution.
通过经验分布函数,我们可以在不假设任何参数化模型的情况下比较两组样本的分布差异。
Empirical 来自“经验的、基于观察的”这一含义(强调从数据/观察出发);distribution function 是统计学中“分布函数”的标准说法,表示“累计概率随 (x) 变化的函数”。合在一起,字面意思就是“由经验数据得到的分布函数”。